<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <link href="/static/css/global.css" rel="stylesheet" type="text/css" />
    <link href="/static/css/comment.css" rel="stylesheet" type="text/css" />
<!--    <script type="text/javascript" src="/static/js/navigation.js"></script>-->
<!--    <script type="text/javascript" src="/static/js/btnChoose.js"></script>-->
    <title>媒体新闻</title>
</head>
<body>
    <div class="banner">
        <a href="http://localhost:8000/home/" class="back-word">BACK</a>
        <div class="subtitle">
            媒体新闻
            <span style="font-family:Adobe Hebrew; font-size:1rem; color:#002233;">MEDIA NEWS</span>
        </div>
        <img src="/static/image/moon.png" class="moon">
        <div class="banner-house">
            <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 1440 320">
                <path fill="#002233" fill-opacity="1" d="M0,64L0,32L55.4,32L55.4,64L110.8,64L110.8,256L166.2,256L166.2,320L221.5,320L221.5,224L276.9,224L276.9,256L332.3,256L332.3,192L387.7,192L387.7,192L443.1,192L443.1,0L498.5,0L498.5,224L553.8,224L553.8,256L609.2,256L609.2,64L664.6,64L664.6,288L720,288L720,32L775.4,32L775.4,32L830.8,32L830.8,128L886.2,128L886.2,192L941.5,192L941.5,96L996.9,96L996.9,224L1052.3,224L1052.3,192L1107.7,192L1107.7,160L1163.1,160L1163.1,224L1218.5,224L1218.5,64L1273.8,64L1273.8,192L1329.2,192L1329.2,64L1384.6,64L1384.6,160L1440,160L1440,320L1384.6,320L1384.6,320L1329.2,320L1329.2,320L1273.8,320L1273.8,320L1218.5,320L1218.5,320L1163.1,320L1163.1,320L1107.7,320L1107.7,320L1052.3,320L1052.3,320L996.9,320L996.9,320L941.5,320L941.5,320L886.2,320L886.2,320L830.8,320L830.8,320L775.4,320L775.4,320L720,320L720,320L664.6,320L664.6,320L609.2,320L609.2,320L553.8,320L553.8,320L498.5,320L498.5,320L443.1,320L443.1,320L387.7,320L387.7,320L332.3,320L332.3,320L276.9,320L276.9,320L221.5,320L221.5,320L166.2,320L166.2,320L110.8,320L110.8,320L55.4,320L55.4,320L0,320L0,320Z">
                </path>
            </svg>
        </div>
    </div>
    <nav id="nav" class="quick-navigation">
        <div class="quick-navigation-word">
            <img src="/static/image/navigation-empty.png">
<!--            <a href="#H1" class="quick-navigation-item">-->
<!--                <img src="/static/image/navigation-section1.png">-->
<!--            </a>-->
            <a href="#H1" id="quick-a">词云图</a>
<!--            <a href="#H2" class="quick-navigation-item">-->
<!--                <img src="/static/image/navigation-section2.png">-->
<!--            </a>-->
            <a href="#H2" id="quick-b">文本聚类</a>
<!--            <a href="#H3" class="quick-navigation-item">-->
<!--                <img src="/static/image/navigation-section3.png">-->
<!--            </a>-->
            <a href="#H3" id="quick-c">情感分析</a>
        </div>
    </nav>
    <div class="main-body">
        <div class="content-container">
            <section id="H1" class="content-part">
                <div class="headline">词云图</div>
                <p>
                    新闻相关数据爬取了10000条左右，其中包括厦门小鱼网的相关新闻和微博的相关新闻，经过数据预 处理之后，采用Textrank算法进行用户评论文本的关键词提取，提取重要性最高的前50个词，并且 除去地名以及一些意义不大的词，最终绘制出如下词云图。
                </p>
                <div class="content-img">
                    <img src={{ total_wordcloud }}>
                </div>
                <p style="font-size:.8rem; text-align:center;">
                    Fig. 1. 词云图可视化结果
                </p>
                <p>
                    新闻数据的关键词主要是“发展”，“施工”，“地铁”等一些侧重于地产规划的关键词。这与一些关于楼盘 规划的官方新闻比较吻合。
                </p>
            </section>
            <section id="H2" class="content-part">
                <div class="headline">文本聚类</div>
                <p>
                    在该部分，最实用K-Means算法进行用户评论文本聚类。 主要将文本转化成词频矩阵，利用PCA降成二维数据，选取K=2进行聚类。聚类结果如下所示
                </p>
                <div class="content-img">
                    <img src={{ cluster_pic }}>
                </div>
                <p style="font-size:.8rem; text-align:center;">
                    Fig. 2. 文本聚类结果
                </p>
                <div class="content-img">
                    <img src={{ cluster0_cloud }}>
                </div>
                <p style="font-size:.8rem; text-align:center;">
                    Fig. 2.1. 聚类1词云图
                </p>
                <div class="content-img">
                    <img src={{ cluster1_cloud }}>
                </div>
                <p style="font-size:.8rem; text-align:center;">
                    Fig. 2.2 聚类2词云图
                </p>
                <p>
                    在第一类中，根据词云图可以看出主要是关于整体房价市场的情况，“上涨”，“价格”，“涨幅” 等关键词比较突出，体现了厦门房价的实际情况，价格高，涨幅明显的特点，可以认为该类是 关于居民对厦门房价的看法，一些民生新闻。 在第二类中，更多的是体现整个厦门楼市的规划，如“发展”，“工程”，“地铁”这些关键词，与 新闻中所涉及的厦门房价的一些政府发展规划也是相吻合的，可以推断这类主要是关于政府对厦 门楼市，厦门房价相关的一些发展规划，属于官方新闻类。
                </p>
            </section>
            <section id="H3" class="content-part">
                <div class="headline">情感分析</div>
                <div class="content-img">
                    <img src={{ sentiment_analysis }}>
                </div>
                <p style="font-size:.8rem; text-align:center;">
                    Fig. 3. 情感分析结果
                </p>
                <p>
                    相比于用户评论，新闻媒体的情感极性呈现出“一边倒”的架势，负面评论（情感极性为0.0）有2000+条 ， 而正面的（情感极性为1.0）仅不足500条，而剩下的评论则均匀分布在各个情感极性上。这是一个非常有意 思的结果。接下来分词性分析。
                </p>
                <div class="content-img">
                    <img src={{ adj_sentiment_analysis }}>
                </div>
                <p style="font-size:.8rem; text-align:center;">
                    Fig. 3.1 形容词情感分析结果
                </p>
                <p>
                    从情感分析图中，可以看出，评论在0.65左右的最多，并且大部分的评论都集中在0.5以上，除此之外0.0的评论数量也很多。可以初步认为，对于房价的看法要么就是极度消极（0.0），要么就是保持着中性但偏向乐观 （0.65-0.8）的态度，基本不会有略微消极（0.1-0.4）或是非常乐观（0.9-1.0）的情况。
                </p>
            </section>
        </div>
    </div>
</body>
</html>